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ji 要 : [目的 /意义 ] 针 对 复杂 网 络 中 的 重要 节点 的 识别 ,设计 一 种 节点 中 心性 算法 ,在 传染 病 防 控 、 和 与 情 监 控 、 产 品 营销 、 
人 才 发 现 等 方面 发 挥 作用 。 [方法 /过程 ] 同时 考虑 节点 的 高 影响 力 令 居 的 数量 及 其 总 体 影响 ,提出 HHa 节点 中 
心性 算法 ,在 真实 网 络 和 人 工 网 络 上 ,使 用 SIR 传染 病 模 型 模拟 信息 传播 过 程 ,采用 单调 函数 M fe de IRR A 


一 | 
号 


: TP393.0 TP301.6 


数 作为 评价 指标 验证 HHa 中 心性 算法 的 有 效 性 、 准 确 性 以 及 稳定 性 。[ 结果 /结论 ] 实验 表明 ,与 7 种 经 典 的 中 心 
性 算法 相 比 ,HHa 中 心性 算法 得 出 的 排序 结果 M 值 为 0.999 等 ,排名 第 2; 肯 德尔 系数 为 0.845 等 ,高 于 其 他 算法 
0.15 左右 ,排名 第 1 且 表 现 稳定 。 采 用 HHa 中 心性 算法 识别 网 络 中 的 重要 节点 具备 可 行 性 。 

节点 中 心性 节点 影响 力 hh 指数 HHa 中 心性 算法 


中 ,及 时 发 现 和 支持 重要 人 才 可 以 促进 知识 流动 ,增加 


CN 从 自然 世界 到 人 类 社会 ,复杂 网 络 无 处 不 在 ,各 个 
系统 中 的 个 体 和 关系 都 可 以 抽象 成 具有 节点 和 边 的 网 
RE ,如 人 类 所 处 的 社交 网 络 、 科 研 合作 网 络 ,宏观 
世 田中 的 电力 网 络 ,交通 网 络 等 ,微观 世界 中 的 蛋白 质 
交 于 网 络 ,基因 网 络 ,病毒 传播 网 络 等 。 网 络 科学 的 发 
展 汉 人 们 认识 客观 世界 增添 了 新 的 视角 ,帮助 人 们 更 
好 地 理解 关系 的 变化 、 信 息 的 传播 “传染 的 扩 
BOE ,疾病 的 治疗 ”等 。 


学 术 交 流 ” 。 

为 此 ,本 文 将 科学 计量 学 中 的 h 型 指数 运用 到 复 
杂 网 络 分 析 中 ,并 做 出 适当 的 改进 ,提出 一 种 考虑 节点 
高 影响 力 邻 居 数 量 及 总 体质 量 的 新 型 中 心性 算法 , 希 
望 能 做 到 计算 复杂 度 和 排序 准确 度 的 平衡 ,更 加 高 效 
地 发 现 复杂 网 络 中 高 影响 力 的 重要 节点 ;然后 在 不 同 
结构 和 功能 的 真实 和 人 工 网 络 上 进行 实验 ,验证 该 中 
心性 算法 的 有 效 性 ,准确 性 以 及 稳定 性 。 以 期 在 传染 
病 防 控 、 奥 情 监控 ,产品 营销 、 人 才 发 现 等 方面 发 挥 作 


无 论 网 络 拥 有 何 种 结构 和 功能 ,关键 节点 都 在 信 


息 传播 中 扮演 着 重要 角色 。 因 此 ,在 复杂 网 络 中 识别 
影响 力 的 节点 获得 越 来 越 多 的 关注 ,并 且 广 泛 应 用 
于 众多 领域 。 比 如 ,传染 病 将 要 爆发 时 ,风险 节点 的 精 
确 查 找 直 接 影 响 到 接种 免疫 政策 的 制定 和 后 续 防 控 的 
难 易 程度 I ;推广 新 产品 时 ,代言 人 物 的 正确 选取 和 
营销 手段 的 精准 策划 能 够 快速 创造 商业 价值 ;在 谣 
言传 播 及 与 情 监控 中 ,意见 领袖 的 发 言 可 以 迅速 过 骨 
谣言 并 且 引导 积极 的 舆论 走向 ” ;在 科研 合作 网 络 


e 


FHo 


2 相关 研究 


识别 网 络 中 有 影响 力 节 点 的 中 心性 算法 可 以 大 致 
分 为 四 类 :第 一 类 算法 最 简单 直接 ,基于 节点 的 邻居 信 
息 ,如 度 中 心性 ,节点 二 的 度 定义 为 与 节点 i 直接 相 
连 的 节点 数目 , 即 节 点 守 的 直接 邻居 数目 。 考 察 与 节 
点 直接 相连 的 邻居 数目 ,该 中 心性 简单 直观 ,便于 计 
算 ,认为 节点 的 邻居 数目 越 多 , 则 节点 越 重要 ,但 却 名 
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心性 算法 :一 种 基于 


虽 数 和 Ha 指数 的 复 


i P HH 
«aas CORIRA! 


略 了 节点 所 处 的 环境 信息 ,比如 节点 在 网 络 的 位 置 . 邻 
居 的 质量 。k-shell 中 心性 "根据 节点 在 网 络 中 的 位 
置 确定 节点 的 重要 程度 ,该 中 心性 认为 位 于 网 络 核心 
的 节点 即使 其 邻居 数 很 少 ,重要 性 通常 也 很 高 ,k-shell 
中 心性 计算 复杂 度 低 , 适 用 于 大 规模 网 络 。 但 k-shell 


序 ,该 方法 认为 与 高 度 节 点 相连 的 低 度 节点 也 可 以 作 
为 高 影响 力 节点 的 候选 ,但 该 指标 涉及 可 调 参 数 .计算 

复杂 , 而 且 准 确 率 较 经 典 算法 提升 不 大 。S，Zhao 
GAL, Cao 45^ h 指数 应 用 于 赋 权 网 络 ,将 边 
的 权重 考虑 在 内 ,定义 了 h-degree 和 weighted h-index 


中 心性 得 出 的 排序 结果 区 分 度 不 高 ,很 多 节点 拥有 同 
EERI k 核 数 , 且 k-shell 在 某 些 网 络 ( 如 星 型 图 .BA 人 
工 网 络 ) 中 不 能 发 挥 最 优 表现 , 且 k-shell 在 逐 层 分 解 
中 考虑 节点 的 邻居 信息 不 够 全 面 , 仅 考虑 节点 的 剩余 
邻居 数 ;第 二 类 算法 关注 节点 在 网 络 中 控制 信息 流 的 


j 以 衡量 赋 权 网 络 中 节点 的 重要 性 ,但 该 类 方法 仍 未 
克服 指数 中 心性 原 有 的 缺点 。P. L. Yang 等 ”将 最 
短 距 离 和 bh 指数 相 结合 , 求 最 短 距离 需要 计算 节点 同 
网 络 中 其 他 所 有 节点 的 距离 ,类 似 上 文 提 到 的 接近 中 
心性 ,需要 遍历 整个 网 络 , 计 算 复 杂 度 高 ,并 且 只 能 求 


e 


能 力 , 即 节点 所 处 的 路 径 , 如 在 交通 网 .电力 网 中 ,重要 
节点 往往 扮演 “ 桥 ” 的 角色 ,中 介 中 心性 ”从 网 络 中 任 
一 节点 对 的 最 短路 径 出 发 ,通过 一 个 节点 的 最 短路 径 
数 越 多 ,该 节点 的 影响 力 越 大 。 接 近 中 心性 ”认为 与 
RÆ P Jl 点 平均 距离 越 小 的 节点 越 重 要 , 即 节点 


2 s 流动 的 


全 WE ee 但 接近 中 
心 肉 只 能 用 于 连通 通 网 络 。 值 得 注意 的 是 ,中 介 中 心性 


委 近 中 心性 都 是 基于 网 络 全 局 信息 的 中 心性 算法 ， 
旗 介 要 遍历 整个 网 络 才 可 以 得 到 所 有 节点 的 影响 力 ， 
时 国 复杂 度 较 高 ;第 第 三 类 算法 是 基于 特征 向 量 的 中 心 
HÈRE ,特征 向 量 中 心性 中 方法 是 该 类 方法 的 典型 代 
花束 方法 判断 节点 的 重要 程度 时 ,不 仅 考虑 了 节点 的 
量 , 还 考虑 了 邻居 节点 的 重要 性 ,但 当 网 络 中 存 
在 湛 较 大 节点 时 ,特征 向 量 中 心性 会 会 将 度 大 的 节点 列 
为 重要 节点 ,对 度 小 的 其 他 节点 区 分 度 不 高 ;第 四 类 算 
活 感 将 科学 计量 学 的 相关 指标 运用 到 复杂 s 网 络 中 ,用 
来 衡量 节点 的 影响 力 。 比 如 A，Kom 等 参照 科学 计量 
学 中 的 h 指数 ,提出 了 lobby-index Ch 指数 中 心性 ) 5 ， 
虽然 计算 简单 ,但 排序 结果 的 区 分 度 并 不 高 , 即 网 络 中 
的 众多 节点 可 能 拥有 相同 的 h 指数 。 

本 文 提 出 的 中 心性 算法 属于 第 四 类 算法 ,因此 接 
下 来 重点 讨论 以 h 指数 为 基础 的 重要 节点 挖掘 方法 。 
L. Y. Lü 等 揭示 了 度 、h 指数 和 核 数 之 间 的 内 在 关 
A E h 指数 和 核 数 ,可 以 通过 一 个 简单 的 算 子 h 连 
接 起 来 ,而 度 .h 指数 和 核 数 是 一 连 串 作用 的 初 态 .中 
ISMEA. Q. Liu 等 中 将 节点 的 指数 和 该 节点 
所 有 邻居 的 上 指数 进行 加 和 作为 识别 网 络 中 重要 节点 
的 指标 ,但 节点 的 邻居 的 度 信息 以 及 邻居 的 质量 仍 未 
完全 考虑 。A. Zareie 等 “借鉴 指数 的 定义 ,设计 了 
一 个 累计 函数 来 计算 节点 的 邻居 度 信息 ,并 且 设置 参 
数 将 邻居 的 度 信息 进行 加 和 以 对 节点 影响 力 进行 排 


得 高 影响 力 的 节点 群 , 没 有 进一步 对 高 影响 力 节 点 的 
影响 力 大 小 进行 区 分 。Y. X. Li 等 “基于 指数 和 
节点 的 + 阶 和 nn 阶 邻 居 的 h 指数 提出 了 衡量 网 络 中 一 
组 节点 影响 力 的 中 心性 (h-index group centrality ) ,但 r、 
n LU PUR A TF ma ES s AP E] 25 4I BA] PI 2 E 1 S] 
对 网 络 的 适用 程度 不 高 , 且 计 算 量 较 大 。 m 
提出 了 将 节点 的 度 和 bh 指数 结合 的 节点 中 心性 度量 方 
法 ,但 该 种 度量 方法 使 用 时 需要 对 涉及 的 参数 进行 调 
试 ,并 且 未 考虑 节点 邻居 的 质量 信息 。A. Abbasi 等 在 
2013 年 提出 了 节点 的 al-index 指数 ,并 将 其 定义 为 对 
该 节点 h 指数 有 贡献 的 邻居 节点 的 平均 度 ” ,单纯 使 
日 该 种 中 心性 分 辩 重 要 节点 的 准确 性 不 高 , 且 并 未 将 
其 与 h 指数 等 联合 用 于 节点 中 心性 排序 。 
通过 上 述 分 析 , 可 以 看 出 , 现 有 各 种 节点 中 心性 算 

法 虽 各 有 优势 ,但 仍 有 可 改进 之 处 :中 目前 的 中 心性 算 
法 有 着 “简单 却 不 够 准确 ,或 者 准确 但 太 复 杂 ” 的 问 
题 , 如 何在 简单 和 准确 中 把 握 平 衡 应 是 新 的 节点 中 心 
性 算法 考虑 的 关键 点 ,要 确保 在 计算 复杂 度 低 的 情况 
下 考虑 尽 可 能 多 的 节点 信息 ;@ 网 络 结构 和 功能 复杂 
多 样 ,节点 中 心性 算法 是 否 在 多 种 网 络 保持 有 效 性 和 
准确 性 ,应 在 大 量 真实 网 络 和 人 工 网 络 上 进行 实验 , 确 
保 节 点 中 心性 算法 的 普 适 性 。 
针对 上 述 问 题 ,本 文 将 科学 计量 学 中 的 b 型 指数 
迁移 运用 到 复杂 网 络 分 析 中 ,进行 节点 中 心性 排序 时 ， 
在 考虑 节点 的 高 影响 力 邻 居 的 数量 的 同时 ,也 考虑 高 

影响 力 邻 居 的 总 体 影响 ,提出 了 一 种 新 的 中 心性 算法 。 
为 了 评价 该 中 心性 算法 的 有 效 性 ,准确 性 以 及 稳定 性 ， 
应 用 SIR 传染 病 模型 模拟 信息 传播 过 程 ,将 肯 德 尔 系 
数 作为 算法 准确 性 评价 指标 ,实验 结果 表明 ,本 文 提出 
的 中 心性 算法 能 够 产生 区 分 度 很 高 的 排序 结果 ,并 且 
与 其 他 7 种 经 典 中 心性 算法 相 比 ,该 中 心性 算法 得 到 
的 排序 结果 更 加 准确 ,针对 不 同 结构 和 功能 的 网 络 ,该 
中 心性 算法 具有 更 好 的 稳定 性 。 本 文 提 出 的 中 心性 算 
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法 可 进一步 用 于 真实 场景 ,有 望 在 优秀 人 才 选 拔 .传染 
病 爆 发 防 控 .与 情 信息 监 控 .产品 营销 推广 等 方面 开发 
实际 产品 。 


3 HHa 中 心性 及 其 计算 方法 

如 图 1 所 示 , 用 网 络 G(V,E) 表示 一 个 有 了 个 项 
点 ,已 条 边 的 网 络 。 节 点 * 的 度 定义 为 与 节点 直接 相 
连 的 邻居 数量 ,用 d (o) 表示 节点 6 的 度 ,N(v) ER v 
的 邻居 ,7(o) 为 的 邻居 中 度 大 于 或 等 于 v 的 h 指数 的 
节点 。h 指数 在 网 络 中 的 定义 :节点 v 的 h 指数 是 b， 
就 说 明 这 个 节点 有 bh 个 邻居 ,它们 的 度 都 不 小 于 ,而 
且 这 个 节点 的 其 他 所 有 邻居 的 度 都 不 大 于 bh, 用 h(5) 
表示 。 本 文 定义 节点 "的 Ha 指数 :在 节点 "的 邻居 
TRORHEK TRUST h Co) 的 节点 的 度 进行 加 和 ,所 
得 茯 数 便 是 节点 的 Ha 指数 ,用 Ha (v) d, Ha (v) ff 
E ee 
Ha(v j= 2, 


` d(w) 公式 (1) 


el(v) 


(S) 图 1 示例 网 络 


易 得 节点 v 的 hn 指数 为 3 ,按照 公式 (1) 计 算 节 


HHa(v;) = (h(v,), Ha (wv) ) =(3,4+3+4) = 


(3,11) 公式 (3) 
HHa(v,) = (h(v,), Ha (v,)) = (2,6+4)= 
(2,10) 公式 (4) 


因此 ,HHa(v,) > HHa(v,) > HHa(v,) , Bl T j5 
v, Wa ws 的 影响 力 和 重要 程度 依次 递减 。 
4 HHa 中 心性 算法 的 有 效 性 和 准确 性 检验 
4.1 数据 集 

为 了 检验 HHA 中 心性 算法 的 表现 ,本 文 将 使 用 不 
同 规模 的 8 个 真实 网 络 ,包括 :Karate”| Dolphins 、 
Jazz?" , Usai197 7 , Email ^ i 
Power?! 。 其 中 Karate „Dolphins , Yeast „Power 是 无 向 x 
JUR] Z& , Usair97 , Jazz , Netscience 是 无 向 加 权 网 络 ， 
Email 是 有 向 无 权 网 络 。 相 关 网 络 的 节点 数 . 边 数 . 平 


均 度 AERE BEUK 1 所 示 : 
表 1 实验 数据 集 基 本 信息 


. Netscience . Yeast" 


网 络 节点 数 边 数 平均 度 d BU RR 
Karate 34 78 4.588 0.129 
Dolphins 62 159 5.129 0.147 
Jazz 198 2742 27.697 0.026 
USAir97 332 2 126 12. 807 0.023 
Email 1 133 5451 9.622 0.054 
Netscience 1 589 2742 3.451 0. 144 
Yeast 2 361 7 182 6. 084 0. 060 
Power 4 941 6 594 2.669 0.258 


4.2 评估 方法 

本 文 使 用 单调 函数 M “来 量化 不 同 中 心性 算法 
给 出 的 排序 结果 的 iae , 即 该 中 心性 算法 是 否 能 对 
各 个 节点 的 影响 能 力 进行 差异 化 识别 ,单调 函数 以 的 


o, 的 Ha 指数 为 13 ,将 h 指数 和 Ha 指数 一 同 使 用 ， 
考虑 节点 的 高 影响 力 邻 居 的 数量 和 总 体质 量 , 定 义 
求 节点 HHa 中 心性 的 算法 :利用 bh 指数 作为 第 一 关 
键 字 对 网 络 中 各 节点 进行 降序 排列 ,再 将 各 节点 的 
Ha 指数 作为 第 二 关键 字 进 行 降序 排列 。 可 以 看 出 ， 
节点 的 hn 指数 和 Ha 指数 越 高 , 则 该 节点 的 影响 力 越 
大 。HHa 中 心性 无 须 遍 历 整 个 网 络 就 可 获取 网 络 中 
节点 的 有 关 信 息 , 算 法 时 间 复 杂 度 低 , 且 计算 简单 。 
例如 ,在 图 1 中 ,用 Epo(o) 表 示 节 点 的 HHa 指数 ， 
节点 ws so 的 HHa 指数 如 公式 (2) -公式 (4) 所 
7R: 

HHa(v,) = (h(v,) , Ha(v,)) 2 (3,3 +4 +3 +3) 
- (3,13) AU) 


定义 如 公 Wa 
>n,(n,-1) 
M(R) = a 
其 中 ,n 是 排序 表 RR 的 元 素 个 数 ,m 是 排序 表 R 上 
具有 相同 排名 的 元 素 个 数 。 单 调 函 数 M 量化 了 排序 
表 中 具有 相同 名 次 元 素 的 比例 。 如 果 排 序 表 RR 是 完全 
单调 的 , 则 单调 性 M(R) 为 1; 如 果 排 序 表 中 所 有 节点 
具有 相同 的 排名 , 则 单调 性 M(R) 为 0。 
目前 , 易 感 - 感染 - 恢复 (SIR ) 传播 模型 ”被 广 
泛 用 于 解释 和 模拟 流行 病 或 信息 的 传播 过 
程 ?4 因此 ,在 本 文中 ,为 了 评估 排序 方 
法 的 性 能 ,采用 SIR 传播 模型 来 检验 排序 节点 的 真实 
影响 力 。 在 SIR 模型 中 ,假设 要 获得 节点 v 的 真实 影 


公式 (5) 
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响 力 ,在 初始 阶段 将 节点 "设置 为 感染 状态 ,其 他 节点 
全 部 设置 为 易 感 状态 。 在 之 后 的 每 个 步骤 中 ,每 个 状 
态 为 感染 的 节点 尝试 以 感染 概率 6 感染 其 状态 为 易 感 
的 邻居 ,并 且 在 每 一 步 中 每 个 被 感染 的 节点 以 y 的 概 
率 转变 为 恢复 状态 。 重 复 此 过 程 ,直到 网 络 中 没有 状 
态 为 感染 的 节点 为 止 。 将 传播 过 程 结 束 时 恢复 状态 的 
节点 数 作为 估算 最 初 感染 节点 " 的 影响 的 指标 。 节 点 
v 的 真实 影响 力 定义 为 在 足够 大 的 模拟 传播 次 数 后 恢 
复 节 点 数 的 平均 值 。 在 本 文中 ,将 模拟 传播 次 数 设置 
为 100 , 即 100 次 SIR 传播 后 的 恢复 节点 数 的 平均 值 作 
为 节点 的 真实 影响 力 。 为 了 量化 各 类 中 心性 算法 的 准 
确 性 ,本 文采 用 Kendall 相关 系数 '” 作为 排名 相关 系 
数 。 假 设 有 两 个 排序 结果 说 = (apaa a) AY = 
Cres sys) , 则 两 个 排序 结果 对 应 元 素 形成 的 元 素 
对 集合 为 i408). 0854 Ya) Xn Va) | ,对 于 
Hber PIBEERE RH GEROR Gs) 与 (%， ») ,如 果 
H y » y, RÉ x; «x, B. y, «y, BE BA XX PIG 
355 — SUIT MR x,» x, B. y; « y, RÉ x; «x; Hy; y; 
esl As 3E PI T6 REA — SCIT R x, =% 或 者 y = 
y P, xx Wi 4- 6 3 BE é — Sic d Rs — Sc 
endal 相关 系数 计算 方法 如 下 :T(X,Y) = (n, -n,)/ 
a(n -1). 其 中 ,n. f n, 分 别 是 一 致 元 素 对 和 不 一 
钼 江 过 对 的 数量 ,为 排序 序 表 或 了 包含 的 排序 结 

yR. 


fea 


在 本 文中 ,基准 排序 结果 为 通过 模拟 SIR 传播 得 
到 的 网 络 中 节点 的 真实 影响 力 排序 , 另 一 个 排序 结果 
是 通过 节点 中 心性 算法 得 到 的 网 络 中 节点 中 心性 排序 
结果 。Kendall 系数 的 取 值 范围 为 [ -1,1] ,系数 越 接 
近 于 1 ,两 个 排序 结果 越 接近 ,说 明 该 中 心性 算法 得 到 
a 亨 结 果 与 模拟 STR. 传播 得 到 的 节点 真实 影响 力 排 

结果 越 接近 ,准确 性 越 高 。 

在 实验 过 程 中 用 DC 表示 度 中 心性 .BC 表示 中 介 
中 心性 .CC 表示 接近 中 心性 、KS 表示 k-shell 中 心性 、 
EV 表示 特征 向 量 中 心性 、H 表示 h 指数 中 心性 、Ha 表 
示 Ha 指数 中 心性 .HHa 表示 HHa 中 心性 。 
4.3 单调 性 检验 

针对 8 个 真实 网 络 数据 集 , 使 用 各 类 中 心性 算法 

得 到 相应 的 节点 影响 力 排序 结果 ,并 使 用 单调 函数 M 
a 果 的 单调 性 ,各 中 心性 算法 排序 结果 
的 单调 函数 M 值 如 表 2 所 示 。 从 表 2 可 以 看 出 ,由 于 
HHa 中 心性 是 基于 节点 的 h 指数 和 Ha 指数 得 到 的 ,所 
以 其 单调 M 值 较 h 指数 中 心性 的 单调 M. 值 有 很 大 提 
升 , 并 且 HHa 中 心性 的 单调 M 值 与 其 他 7 种 中 心性 单 
调 允 值 相 比 ,处 于 上 游 水 平 , 仅 次 于 特征 向 量 中 心性 
或 中 介 中 心性 ,排名 第 2 或 第 3。 说 明 本 文 提 出 的 HHa 
中 心性 可 以 较 好 地 识别 和 区 分 网 络 中 具有 不 同 影响 力 
的 节点 ,各 节点 能 够 被 赋予 不 同 的 指标 值 ,本 文 算法 具 
有 竞争 优势 。 


表 2 不 同 中 心性 算法 在 8 个 真实 网 络 数据 集 上 的 单调 函数 M 值 


M(DC) M(BC) M(CC) M(EV) M(KS) M(H) M(Ha) M(HHa) 
n= Karate 0. 708 0.775 0. 899 0.958 0.496 0.577 0.930 0. 940 
"I 0.831 0. 962 0.974 0. 998 0.377 0. 684 0.957 0.974 
Jazz 0. 966 0. 989 0. 988 0. 999 0. 794 0.938 0. 998 0. 999 
Usaii97 0. 859 0.697 0. 989 0.995 0.811 0. 836 0. 992 0. 994 
Email 0. 887 0.940 0. 999 1.000 0. 809 0. 858 0. 994 0. 998 
Netscience 0. 738 0. 090 0. 909 0.917 0. 700 0. 707 0. 897 0. 908 
Yeast 0. 734 0. 701 0. 996 0.997 0.674 0. 698 0. 984 0. 990 
Power 0. 593 0. 832 1.000 1.000 0.246 0. 393 0. 881 0.924 
4.4 准确 性 检验 正 党 进行 ;如 果 感 染 率 B 远 远 大 于 传播 阅 值 , 则 传播 过 
接 下 来 ,通过 将 不 同 中 心性 算法 得 到 的 排序 结 程 会 在 网 络 中 迅速 激烈 地 展开 ,并 导致 所 有 节点 都 被 
与 从 SR 模拟 传播 获得 的 节点 影响 力 排 序 表 进 行 比 | 感染 ,最 后 都 变 为 恢复 状态 。 因 此 ,将 感染 率 B 设置 在 


较 , 计 算 两 者 之 间 的 Kendall 相关 系数 ,研究 不 同 中 心 
性 算法 的 准确 性 ,Kendall 系数 越 大 ,表明 相应 的 中 心 
性 算法 得 到 的 节点 影响 力 排序 结果 准确 性 越 高 。 在 
SIR 模拟 中 ,首先 将 感染 概率 B 设置 在 网 络 的 传播 阔 
f" B, = «k»/«k > Mr, Krp «ko os IRE 
均 度 ,如 果 感 染 率 B 远 小 于 传播 冰 值 , 则 传播 过 程 无 法 


传播 闵 值 附近 是 合理 和 可 行 的。 其 次 ,设置 节点 从 感 
染 状 态 到 恢复 状态 的 恢复 概率 为 y =1I/ < 大 > 。 与 
传统 的 SIR. 传播 模型 相 比 ,本 文 感染 率 和 恢复 率 的 个 
性 化 设置 更 能 体现 网 络 的 实际 情况 ,能 够 更 有 效 地 评 
价 网 络 中 节点 的 真实 影响 力 。 各 中 心性 算法 得 出 的 排 
序 结果 与 SIR 传播 模型 排序 结果 的 Kendall 系数 如 表 3 
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所 示 。 从 表 3 可 以 看 出 ,在 8 个 真实 网 络 中 ,HHa 中 心 
性 的 Kendall 相关 系数 均 大 于 h 指数 中 心性 的 Kendall 
相关 系数 ;在 Karate , Dolphins , Usair97 , Email 和 Yeast 
网 络 中 ,HHa 中 心性 的 Kendall 相关 系数 较 其 他 7 种 中 
心性 算法 处 于 首位 ,准确 性 最 高 ;在 Jazz 网 络 中 , 仅 次 


于 度 中 心性 或 特征 向 量 中 心性 ,识别 效果 处 于 第 二 位 ; 
在 Power 网 络 中 , 仅 次 于 特征 向 量 中 心性 和 Ha 指数 中 
心性 ,识别 效果 位 于 第 三 位 ;在 Netscience 网 络 中 , 识 
别 效果 位 列 第 四 。 


RI 不 同 节点 中 心性 算法 在 S 个 真实 网 络 数据 集 上 与 节点 真实 影响 力 的 肯 德 尔 相 关系 数 


网 络 Bu B T(DC) T(BC) T(CC) T(EV) T(KS) T(H) T(Ha) T( HHa) 
Karate 0.129 0.130 0. 640 0. 569 0.611 0.647 0. 569 0.579 0.572 0. 697 
Dolphins 0. 147 0. 150 0. 689 0. 523 0.571 0.575 0. 538 0. 664 0. 703 0.711 
Jazz 0. 026 0. 026 0.595 0. 354 0. 507 0. 543 0. 542 0. 586 0.576 0. 587 
Usai197 0. 023 0.023 0. 760 0. 521 0.727 0.801 0. 773 0. 776 0. 797 0.834 
Email 0.054 0.055 0. 824 0.667 0. 706 0. 702 0. 796 0.819 0.782 0.829 
Netscience 0.144 0.145 0.644 0.188 0. 863 0. 849 0.614 0.624 0. 802 0. 713 
Yeast 0. 059 0. 060 0. 730 0.576 0.754 0. 712 0.744 0. 750 0. 790 0.845 
T Power 0.258 0. 260 0. 389 0. 299 0.392 0. 595 0.315 0.345 0. 598 0.542 


Leu 的 影响 ,在 SIR 传播 模型 中 
i B 的 值 为 0.01 -0.20。 如 图 2 所 示 ,在 Dolphins 、 
Uga97 FI Yeast 网 中 , 随 着 感染 概率 B 的 增 大 ,HHa 的 
上 崩 乱 尔 相 关系 数 7 值 都 显著 高 于 其 他 7 种 中 心性 ,在 
ER 网 中 HHs 中 心性 的 肯 德 尔 了 值 在 感染 概率 6 较 
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Infection probability 


(c) Email 


小 时 表现 较 好 ,能 够 明显 看 出 识别 准确 性 处 于 首位 ,但 
随 着 感染 率 B 增 大 ,HHa 中 心性 的 优势 不 再 明显 ,但 仍 
处 于 前 列 。 可 以 推测 ,网 络 的 结构 特性 会 影响 信息 在 
整个 网 络 上 的 传播 过 程 。 因 此 ,本 文 接 下 来 使 用 人 工 


网 络 研究 网 络 结构 所 带 来 的 影响 。 


0.9 T um 


Infection probability 
(b) Usair97 


Infection probability 


(d) Yeast 


2 真实 网 络 中 不 同感 染 率 下 的 节点 影响 力 与 各 节点 中 心性 算法 的 肯 德 尔 相关 系数 


本 文采 用 LFR AT B9 28/7 作为 网 络 实验 模型 。 


平均 度 为 5 ,最 大 度 为 50 ,网 络 中 节点 的 度 符合 参数 为 


TE LER 网 络 中 ,有 众多 可 以 表征 网 络 结构 特征 的 参 
数 ,通过 设置 不 同 的 参数 取 值 ,可 以 构建 不 同 结构 的 网 
络 , 以 此 来 看 网 络 结构 的 变化 是 否 会 对 HHa 的 适用 性 
产生 影响 。 设 置 初始 默认 参数 为 :节点 数量 为 1 000, 


y 72 的 指数 分 布 ,社团 的 混合 参数 人 =0.2。 通 过 变化 
节点 数量 平均 度 、 度 分 布 指数 .以 及 社团 混合 参数 来 
评估 这 些 参 数 变 化 所 带 来 的 影响 。 

首先 ,设置 网 络 节 点 数量 分 别 为 V = 500,1 000, 


96 


— 
lid. Bade RP E Ca ioo E LAO «rade ibd S AO 
2021 ,65(20) :92 - 100. 


1 500 ,如 图 3 所 示 , 当 感染 率 较 小 时 ,接近 中 心性 、 特 | 量 中 心性 以 及 Ha 指数 中 心性 的 表现 迅速 下 降 , HHa 
征 向 量 中 心性 和 Ha 指数 中 心性 是 衡量 节点 重要 程度 | 中 心性 较 其 他 中 心性 有 显著 优势 。 
的 有 效 方法 ,但 当 感 染 率 增 大 时 ,接近 中 心性 、 特 征 向 


r 02 " a 
0.15 0.2 0 0.05 0.1 


$ 1 à a 03 —M( " 
0 0.05 0.1 0.15 02 0 0.05 0.1 


0.15 


Infection probability Infection probability Infection probability 
(a) LER N=500 (b) LFR N=1 000 (c) LFR N-1 500 


3 LFR 网 络 (改变 网 络 中 的 节点 数量 ) 中 各 节点 中 心性 算法 与 真实 影响 力 的 肯 德 尔 系数 变化 


三 其 次 ,设置 网 络 平均 度 分 别 为 <h> =5,10,15, 如 | 由 于 当 网 络 平均 度 较 大 和 感染 概率 较 大 时 ,选取 网 络 
ADR, 值得 注意 的 是 , 随 着 网 络 平均 度 的 增 大 ，| 的 任 一 节点 作为 初始 感染 态 节 点 都 能 使 得 信息 迅速 日 

中 心性 逐渐 接近 度 中 心性 ,其 至 当 平均 度 <k> = | 广泛 地 传播 ,节点 的 重要 程度 在 这 种 情况 下 被 削弱 。 
15,8 种 中 心性 表现 趋 于 重 炙 ,并 且 随 着 感染 率 的 增 | 但 HHa 中 心性 算法 仍 能 在 感染 率 较 小 时 获得 最 优 表 
者 如 种 中 心性 算法 的 准确 性 都 明显 下 降 。 这 可 能 是 | 现 。 
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0 0.05 0.1 0.15 0.2 0 0.05 0.1 0.15 0.2 0 0.05 0.1 0.15 
Infection probability Infection probability Infection probability 
(a) LER «k»-5 (b) LFR <k>=10 (c) LFR <k>=15 
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4 LFR 网 络 (改变 网 络 的 平均 度 ) 中 各 节点 中 心性 算法 与 真实 影响 力 的 肯 德 尔 系数 变化 
接 下 来 ,设置 节点 的 度 分 布 指数 1=2,2.5,3, 如 图 | 处 于 中 上 游 水 平 , 但 随 着 感染 率 的 增加 ,HHa 中 心性 算 


5 所 示 , 可 以 看 出 ,无 论 度 分 布 指数 如 何 取 值 ,HHa 中 | 法 的 表现 总 是 会 超过 其 他 中 心性 算法 ,居于 首位 。 
心性 算法 表现 都 比较 平稳 ,虽然 在 感染 率 较 小 时 只 能 


0.8 0.8 0.8 
0.7 
0.6r 
E 
0.5 
0.4| * 
03 A scc. n n n E i i 
0 0.05 0.1 0.15 0.2 2020 0.05 0.1 0.15 0.2 a 0.05 0.1 0.15 
Infection probability Infection probability Infection probability 
{a) LFR t=2 (b) LFR t=2.5 (c) LFR t=3 


图 5 LFR 网 络 (改变 网 络 的 度 分 布 指数 ) 中 各 节点 中 心性 算法 与 真实 影响 力 的 肯 德 尔 系数 变化 
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最 后 ,设置 社团 混合 参数 .=0.2,0.5,0.8, 如 图 6 
所 示 。 社 团结 构 是 网 络 中 非常 重要 的 一 个 特性 , 当 社 
团 混合 参数 较 低 时 ,LFR benchmark. 会 创建 具有 明显 社 
团结 构 的 随机 网 络 。 实 验 结果 表明 ,无 论 社团 结构 清 


a 


能 
影响 力 的 节点 ,并 且 表 现 远 远 高 于 其 他 7 种 中 心性 


算法 。 


d Ha 
0^ Los i , 045 : A osL  ， , —— HHa 
0 0.05 01 0.15 0.2 0.05 0.1 0.15 0.2 0 0.05 0.1 0.15 0.2 
Infection probability Infection probability Infection probability 
(QLER p -02 (b) LFR y. -0.5 (c) LER p =0.8 


总 的 来 说 ,在 基于 网 络 规模 节点 数 或 其 他 参数 变 
的 LFR 网 络 上 ,虽然 网 络 的 拓扑 性 质 发 生 了 变 
做 组 HHa 中 心性 算法 总 能 更 准确 地 识别 出 网 络 中 的 
重 红 节点 。 当 感染 率 比较 小 时 ,由 于 传播 难以 扩散 , 传 
播 获 围 只 限于 局 部 邻居 节点 ,这 时 拥有 邻居 越 多 的 节 
点 亩 党 能 影响 更 多 的 节点 ,因此 感染 率 较 低 时 , 度 中 心 
性 铺 法 表现 较 好 。 而 当 感染 率 较 大 时 ,邻居 之 外 的 节 
RESO D AE REB, RE rd aD dE AERE AS EZH 
SB, HHa 中 心性 算法 的 优势 变 得 更 加 明显 。 相 比 其 
心性 算法 ,HHa 中 心性 算法 的 稳定 性 更 高 , 即 对 参 
变化 的 敏感 性 更 低 ,在 拥有 不 同 网 络 结构 特征 的 
LPE 网 络 中 ,验证 了 HHa 中 心性 算法 的 有 效 性 和 准确 
5 “总 结 与 讨论 


本 文 提出 了 一 种 有 效 的 排序 方法 一 一 HHa 中 心性 
算法 ,即使 用 h 指数 和 Ha 指数 来 衡量 复杂 网 络 中 节点 
的 影响 力 。 目 前 现 有 的 算法 存在 “简单 而 不 准确 ,准确 
但 太 复 杂 ” 的 缺点 ,本 文 提出 的 HHa 中 心性 算法 将 科 
学 计量 学 里 的 指标 迁移 运用 到 复杂 网 络 中 ,在 进行 节 
点 中 心性 排序 时 ,同时 考虑 了 节点 的 高 影响 力 邻 居 的 
数量 和 高 影响 力 邻居 的 总 体 影 响 , 较 好 地 把 握 了 算法 
的 简单 性 和 准确 性 之 间 的 平衡 。 实 验 结果 证 明 ,HHa 
中 心性 算法 是 一 种 可 以 评估 网 络 信息 传播 能 力 、 识 别 
网 络 中 的 重要 节点 的 简单 且 有 力 的 方法 。 首 先 ,本 文 
通过 单调 函数 MM 来 衡量 各 中 心性 能 否 区 分 节点 的 重 
要 性 大 小 ,在 8 个 真实 网 络 上 进行 实验 ,实验 结果 表明 
HHa 中 心性 较 h 指数 中 心性 和 Ha 指数 中 心性 能 产生 
更 多 的 单调 排名 ,和 其 他 7 种 指标 相 比 处 于 中 上 游 地 


ml 


图 6 LFR 网 络 ( 改变 网 络 的 社团 混合 参数 ) 中 各 节点 中 心性 算法 与 真实 影响 力 的 肯 德 尔 系数 变化 


位 。 此 外 ,为 了 度量 HHa 中 心性 得 到 的 节点 影响 力 排 
序 的 准确 性 ,将 SIR 传染 病 模 型 的 传播 结果 作为 节点 
的 真实 影响 力 , 使 用 肯 德 尔 相 关系 数 来 衡量 各 中 心性 
算法 得 到 的 排序 结果 和 SIR 传染 病 模型 得 到 的 排序 结 
果 的 一 致 性 ,与 其 他 中 心性 算法 相 比 ,HHa 中 心性 算法 
准确 性 最 高 。 基 于 LFR benchmark ,在 具有 不 同 拓扑 性 
质 的 人 工 网 络 上 进行 实验 ,HHa 中 心性 算法 的 准确 性 
和 稳定 性 明显 优 于 其 他 中 心性 方法 算法 。 

本 文 的 实验 网 络 集 包 含有 向 \ 无 向 、 加 权 \ 无 权 网 
络 ,HHa 中 心性 在 这 些 网 络 上 都 取得 了 很 好 的 效果 ,说 
明 HHa 中 心性 应 用 范围 广泛 ,但 由 于 HHa 中 心性 是 基 
F h 指数 中 心性 和 Ha 指数 中 心性 得 到 的 ,而 h 指数 9 
心性 和 Ha 中 心性 不 考虑 网 络 中 边 的 方向 及 权重 ,所 以 
HHa 中 心性 也 未 将 边 的 方向 及 权重 考虑 在 内 ,今后 可 
以 基于 这 两 点 对 HHa 中 心性 进行 改进 ,让 其 考虑 的 网 
络 信息 更 多 ,在 确保 应 用 普 适 性 的 同时 ,提高 其 应 用 针 
对 性 和 选择 性 。 值 得 注意 的 是 ,节点 的 重要 性 是 在 网 
络 的 结构 和 功能 中 体现 出 来 的 ,因此 评价 中 心性 算法 
的 有 效 性 和 准确 性 必须 要 结合 网 络 的 具体 结构 和 功能 
进行 ,虽然 本 文 在 LFR 网 络 上 对 提出 的 HHa 中 心性 算 
法 的 适用 性 和 一 般 性 进行 了 较 完 整 的 测试 ,但 本 文选 
取 的 真实 网 络 数据 集 仍 不 够 多 , 仍 未 涵盖 所 有 的 功能 
目标 。 

此 外 ,SIR 模型 只 是 对 现实 世界 的 高 度 模拟 和 抽 
象 的 结果 ,虽然 具有 一 定 的 指导 意义 ,但 由 于 真实 网 络 
中 的 个 体 特性 不 一 \ 不 确定 性 较 大 ,得 出 的 结果 可 能 
真实 情况 有 出 入 。 

最 后 ,本 文 提出 的 HHa 中 心性 算法 在 充分 进行 小 
规模 的 真实 实验 后 ,可 扩大 应 用 范围 ,在 实际 场景 中 进 
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行使 用 ,辅助 人 工 高 效率 地 进行 重要 节点 的 发 现 。 比 
如 发 现 著名 学 者 和 领军 人 才 获取 领域 重要 论文 查找 
微 博 高 影响 力 用 户 .识别 关键 致 病 基因 \ 提 取 文 章 关 键 
词 .控制 传染 病 流 行 、 搜 寻 罪 犯 及 恐怖 分 子 、 控 据 意 见 
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Abstract: | Purpose/significance | For the identification of important nodes in complex networks, the paper de- 


nion monitoring, product marketing, talent discovery and so on. | Method/process | This paper proposed a new 


x. a node centrality algorithm, which plays an important role in infectious disease prevention and control, public 


iode centrality algorithm, the HHa node centrality algorithm, taking both the number of the node" s high influence 


H mem 
.meighbors and their total influence into consideration. On the real network and artificial network , the Susceptible-In- 


feéted-Recovered (SIR) model was used to simulate the information dissemination process, and the monotonic func- 


tion M and Kendall correlation coefficient were used as evaluation indicators to verify the effectiveness, accuracy and 


stability of the HHa centrality algorithm. | Result/conclusion | The experimental results show that, compared with 


the 7 classic centrality algorithms, the HHa centrality algorithm ranks 2nd with a monotonic result of 0. 999 , and the 


Kendall coefficient is 0. 845 , which is higher than other algorithms’ accuracy about 0. 15 , ranking 1st and perform- 


ing robustly. It is feasible to use HHa centrality algorithm to identify important nodes in the network. 


Keywords: complex networks node centrality 
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